使用 Python 搭建简易版AlphaGo

本文介绍如何使用Python和TensorFlow搭建简易版AlphaGo,基于MuGo开源项目。首先,确保安装TensorFlow,然后下载并预处理SGF围棋文件。预处理过程中可能需要安装额外的库。接着,利用策略网络进行监督学习,可以选择原始策略网络或蒙特卡洛搜索树策略。详细步骤和参考资料提供给读者进一步探索。
摘要由CSDN通过智能技术生成

本博文使用的是GitHub上的MuGo开源程序,使用的是纯Python语言,主要是AlphaGo的一个复制的版本。项目的地址请看后面的参考文献部分。

AlphaGo主要使用了三个神经网络,即第一个速度缓慢但是准确的蒙特卡洛搜索树,主要用来预测人来的棋子的移动。第二个主要是小的一个策略网络但是速度很快。第三个是一个价值网络,只是用来计算胜率的不能用来预测棋子的移动。具体的看下面参考文献列出来的Google的paper。

废话了这么多,下面我们就开始操作纯Python版的简易AlphoGo吧。

1. 首先是安装好TensorFlow,安装教程这里就不多说了,具体的看这个链接:https://www.tensorflow.org/get_started/os_setup

2. 下载SGF文件并且预处理,可以在这个网址上面下载最近15年的围棋文件:https://u-go.net/gamerecords/ 

3. 预处理SGF文件,在与处理的时候可能会提示缺少例如sgf 包,gtp包之类的,用pip对应的安装上去就可以了。

python main.py preprocess ~/kgs-19-2016-12-new/
这里的 ~/kgs-19-2016-12-new/ 的意思是我上面下载下来的SGF文件,用unzip解压之后的文件夹为 kgs-19-2016
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值